The impact of domains for Keyphrase extraction (Influence des domaines de spécialité dans l'extraction de termes-clés) [in French]
نویسندگان
چکیده
Résumé. Les termes-clés sont les mots ou les expressions polylexicales qui représentent le contenu principal d’un document. Ils sont utiles pour diverses applications, telles que l’indexation automatique ou le résumé automatique, mais ne sont pas toujours disponibles. De ce fait, nous nous intéressons à l’extraction automatique de termes-clés et, plus particulièrement, à la difficulté de cette tâche lors du traitement de documents appartenant à certaines disciplines scientifiques. Au moyen de cinq corpus représentant cinq disciplines différentes (archéologie, linguistique, sciences de l’information, psychologie et chimie), nous déduisons une échelle de difficulté disciplinaire et analysons les facteurs qui influent sur cette difficulté.
منابع مشابه
State of the Art of Automatic Keyphrase Extraction Methods (État de l'art des méthodes d'extraction automatique de termes-clés) [in French]
State of the Art of Automatic Keyphrase Extraction Methods This article presents the state of the art of the automatic keyphrase extraction methods. The aim of the automatic keyphrase extraction task is to extract the most representative terms of a document. Automatic keyphrase extraction methods can be divided into two categories : supervised methods and unsupervised methods. For supervised me...
متن کاملTopicRank : ordonnancement de sujets pour l'extraction automatique de termes-clés
Keyphrases are single or multi-word expressions that represent the main content of a document. As keyphrases are useful in many applications such as document indexing or text summarization, and also because the vast amount of data available nowadays cannot be manually annotated, the task of automatically extracting keyphrases has attracted considerable attention. In this article we present Topi...
متن کاملExploitation de la morphologie pour l'extraction automatique de paraphrases grand public des termes médicaux
The medical area conveys very specific terms (p. ex., blepharospasm, appendicectomy), which are difficult to understand by people without medical training. We propose an automatic method for the acquisition of paraphrases, which we expect to be easier to understand than the original terms. The method is based on the morphological analysis of terms, syntactic analysis of texts, and text mining o...
متن کاملLes termes complexes dans les LSP: des processus de collaboration entre les unités textuelles et les unités terminologiques
Résumé : Notre projet concerne l’étude du comportement et de la linéarité des termes complexes (TC) en perspective contrastive français/italien, à l’intérieur des textes de spécialité. Notamment, notre objectif est de présenter comment les TC peuvent se modifier à l’intérieur des textes de spécialité et quels sont les raisons qui poussent à leur variation. Notre poster s'insère dans le cadre d'...
متن کاملExtraction de termes centrée autour de l'expert
Résumé. Nous développons un logiciel, Exit, capable d’aider un expert à extraire des termes qu’il trouve pertinents dans des textes de spécialité. Tout est mis en place pour faciliter le travail de l’expert afin qu’il puisse consacrer son temps à la seule reconnaissance des termes pertinents. Pour cela, différentes mesures statistiques et de nombreuses options d’extraction sont disponibles dans...
متن کامل